Representación del Conocimiento de Sentido Común

REPRESENTACIÓN DEL
CONOCIMIENTO DE
SENTIDO COMÚN

“El sentido común (sensus communis) es el corazón donde toda la información de los diferentes sentidos se unen en un todo inteligible” (Aristóteles)

“El buen sentido es la cosa mejor repartida del mundo” (Descartes)

“El sentido común es un instinto de la verdad” (Max Jacob)

¿Qué es el Sentido Común?
Las opiniones

Existen diferentes opiniones o visiones sobre el sentido común:

Es el entendimiento general de una situación a través de una percepción directa e inmediata.
Es la estructura lógica del mundo o el conocimiento general sobre cómo funciona el mundo.
Es un conjunto de principios comunes o conocimientos generales compartidos por todos los seres humanos, que nos permiten comprender y valorar toda clase de situaciones y actuar de una manera razonable y efectiva.
Es una lógica implícita subyacente. Es la lógica que utilizan continuamente las personas sin darse cuenta.
Es la interpretación más simple, lógica y directa de toda clase de situaciones. Es comprender una situación y eventualmente actuar en consecuencia.
Es lo que la gente piensa a nivel general sobre cualquier tema en particular. Es un acuerdo o consenso natural de todas las personas.
Es una creencia que la gente considera prudente sobre un tema o situación, sin necesidad de que esa información esté comprobada científicamente. Lo único que importa es que la mayoría de las personas lo creen o piensan en “común”.
Es equivalente a la conciencia o algo muy relacionado con ella.
Para Aristóteles, el sentido común es una percepción integrada de una situación en un todo inteligible.
John Locke, en su “Ensayo sobre el entendimiento humano”, opina algo similar a Aristóteles: es un sentido integrador de las impresiones dispersas procedentes de los datos sensoriales en una sola impresión.

Características

El sentido común presenta las siguientes características:

Es conocimiento tácito, implícito, frente al conocimiento específico de un dominio, que es explícito. Por ejemplo: el tiempo no retrocede, una piedra no tiene capacidad de volar por sí misma, Madrid es una ciudad, en la Tierra hay vida, el fuego quema, el cielo es azul durante el día, en el verano hace calor, los padres son más viejos que los hijos, una cosa caliente calienta a una cosa fría, una cuerda sirve para tirar de un objeto y no para empujarlo, las leyes son las reglas de la sociedad, las personas tienen dos brazos y dos piernas, los perros son animales y tienen cuatro patas, los pájaros pueden volar, una impresora es una máquina, un científico es una persona, la gente son personas, las personas viven en un intervalo temporal ininterrumpido, los peces viven en el agua y mueren si se les saca de ella, los objetos caen si se les suelta, la hierba crece, no se puede andar sobre el agua, las personas suelen dormir de noche, verde es un color, color es una propiedad que tienen los objetos, un objeto no puede estar en varios lugares a la vez, dos objetos no pueden estar en el mismo lugar del espacio, no es posible desplazarse instantáneamente a otro lugar del espacio, etc.
Está relacionado con el humanismo (la escala humana), la conciencia, la simplicidad, la verdad, la intuición, el lenguaje ordinario, las creencias fundamentales, lo ingenuo, la sabiduría popular y la opinión pública.
Está más próximo al nivel intuitivo que el puramente racional o analítico, pues el sentido común también lo tienen los animales no-racionales.
Es conocimiento cualitativo, probable o aproximado, donde muchas veces no existe certeza absoluta.
Es síntético, general o global. Por eso muchos afirman que está más allá de la lógica o que desafía a la lógica, al análisis racional. Por su carácter global, integrador o intuitivo, se ha asociado con la conciencia o con algo estrechamente relacionado con ella. Y esto justificaría que el sentido común es muy difícil de definir, como ocurre con la conciencia.
Requiere o implica tener un modelo del mundo, modelo que también lo tienen los animales.
Es una plataforma de comunicación compartida: la plataforma común de entendimiento humano. Cuando las personas se comunican, se supone una gran plataforma de conocimientos de sentido común compartida. Si no existiera esa plataforma, la comunicación sería muy compleja, pues habría que detallar todo lo que se dice hasta un cierto nivel. Siempre debe haber una plataforma mínima (o límite) basada en unos conceptos esenciales, pues si no, la comunicación sería imposible. En este sentido, el sentido común es algo próximo a la conciencia y al sistema (operativo-descriptivo) de la comunicación humana.
Es una red de conocimientos interrelacionados. Un conocimiento concreto de sentido común no está aislado; está conectado con otros conocimientos de sentido común.
Implica inferencias automáticas. Estas inferencias pueden ser de dos tipos: simple y compuesta. Una inferencia simple es que de la sentencia “Pepe es ingeniero” se infiere que Pepe es una persona. Una inferencia compuesta es que de la sentencia “Juan pidió al camarero una paella” se infiere todo un contexto: 1) que Juan y el camarero son personas; 2) que la petición fue oral; 3) que, como Juan podía hablar, tendría al menos 2 años de edad; 4) que, puesto que el camarero estaba trabajando e un restaurante, debía ser mayor de edad; 5) que la petición tuvo lugar en un restaurante; 6) que Juan era cliente del restaurante y que quería comer; 7) que Juan y el camarero estaban espacialmente próximos, pues el camarero oía a Juan; 8) que Juan y el camarero hablaban el mismo idioma.

Las inferencias automáticas pueden implicar un guión, es decir, una secuencia estereotipada de eventos predeterminados. En el ejemplo de Juan y el camarero, se supone que, tras la petición: 1) Juan debería esperar un tiempo razonable a que le trajeran lo pedido; 2) Juan empezaría a comerlo en cuanto se lo sirvieran; 3) Al terminar, Juan pediría la cuenta; 4) El camarero le traería la cuenta; 5) Juan pagaría la cuenta; 6) Finalmente, Juan abandonaría el restaurante.
Ante toda situación, infiere la interpretación más simple y probable, es decir, tiene un cierto carácter probabilístico. Por ejemplo, en el caso del restaurante, hay una probabilidad alta de que el evento tuviera lugar en España (por ser la paella un plato típico).
Supone un mínimo de consumo de energía mental, pues lo usa la gente de manera rutinaria, automática y sin aparente esfuerzo.
Es muy amplio y variado. Hay muchos tipos de conocimiento de sentido común: físico, social, cultural, etc. Y una enorme colección de conceptos, ideas y relaciones en muchos dominios: casas, carreteras, energía, libros, vestidos, herramientas, etc.
Falla a escala cuántica y relativista, pues los fenómenos a estas escalas desafían al sentido común. Por ejemplo, en física cuántica: superposición de estados, la superación del espacio físico mediante el entrelazamiento cuántico, el efecto túnel (desplazamiento instantáneo en el espacio de entes cuánticos), etc. Y en física relativista, a velocidades próximas a la velocidad de la luz, el tiempo se expande, las distancias se acortan y la masa aumenta.

El Problema del Conocimiento de Sentido Común en Inteligencia Artificial
Uno de los grandes problemas de la IA es el de la representación y gestión del conocimiento de sentido común, pues para que un sistema pueda interrelacionar con la realidad, es necesario un razonamiento eficaz en la toma de decisiones. Para que las máquinas sean inteligentes, deben ser capaces de reconocer cosas y relaciones que son evidentes para nosotros

Es paradójico, pues el conocimiento de sentido común se supone que es el más básico y, a la vez, es el más difícil de implementar en sistemas de IA. Se ha demostrado que es más difícil crear sistemas capaces de razonamiento de sentido común que sistemas capaces de resolver problemas de razonamiento en dominios específicos como un sistema experto de diagnóstico médico o un sistema que juegue al ajedrez. Las razones de esta dificultad son:

Al basarse en conocimientos tácitos, difusos, genéricos, intuitivos, cualitativos y no cuantificables, es de difícil formalización, especialmente mediante sentencias declarativas.
Es muy amplio. No se sabe con seguridad la cantidad de conocimiento que es necesario para que un sistema sea capaz de presentar inteligencia a nivel humano. Pero se estima que es del orden de millones de reglas, por lo que se necesita mucha memoria.
No tiene fronteras bien definidas que nos permitan concentrarnos de forma independiente en las partes que lo componen.
Es interdependiente.
Requiere aprendizaje. Un sistema que no sea capaz de aprender nunca podrá poseer sentido común a nivel humano, pues siempre actuará de forma mecánica.

Para Marvin Minsky [2000], pedir que un programa de ordenador entienda cosas de sentido común, es casi equivalente a pedir que la máquina piense.

Construir un sistema capaz de razonar con sentido común, como los humanos, fue durante cierto tiempo, el objetivo principal de la IA. Pero, hoy día, la mayoría de los investigadores han renunciado a ese ambicioso proyecto, centrándose solo en clases específicas de problemas. En este aspecto, los progresos en IA en los últimos años han estado limitados a dominios particulares: juegos (como ajedrez, damas y backgammon), diagnóstico médico, gestión de redes, etc. Pero para conseguir una verdadera IA, una IA de tipo general, es necesario incorporar el conocimiento de sentido común de los humanos en las máquinas, pues los humanos son capaces de pensar en muchos y diferentes dominios.

Los investigadores de IA han bautizado el conocimiento de sentido común como “conocimiento ingenuo”. Este tipo de conocimiento aparece en numerosas disciplinas. Se puede hablar, por lo tanto, de física ingenua, economía ingenua, psicología ingenua, matemática ingenua, etc.

Las razones para implantar sentido común en las máquinas

Hay varias razones por las que en la IA pone énfasis en el conocimiento de sentido común en lugar de conocimiento específico, experto o científico:

Para tratar de emular la inteligencia humana y aproximarse lo más posible a la conciencia.
Porque el conocimiento de sentido común es fundamental, general, profundo y unificado. En cambio, el conocimiento científico es particular, superficial, específico y fragmentado.
Para fundamentar los conocimientos específicos de los dominios. Todo conocimiento científico debe sustentarse en el conocimiento básico de sentido común. Las bases de conocimientos especializadas son frágiles, no tienen un fundamento firme. Deberían construirse sobre el sentido común.
Porque todo conocimiento científico pasa por una etapa precientífica en la que el sentido común es fundamental, pues la estructura de una teoría científica emerge desde el sentido común, es decir, desde lo profundo a lo superficial. Es lo que se suele denominar “sentido común informado” o conocimiento genérico de un dominio específico. La teoría científica va emergiendo del sentido común a medida que las descripciones del mundo son más precisas.
Para conseguir sistemas expertos más versátiles y abiertos. Los sistemas expertos solo se comportan correctamente en sus dominios específicos, pero son cerrados (con fronteras definidas) y nada flexibles (no pueden expandir el conocimiento hacia otras áreas).
Para facilitar la comunicación entre sistemas especializados.
Para facilitar el entendimiento del lenguaje natural.
Para poder detectar e implementar metáforas o analogías.

Estrategias de implantación del sentido común

Hay básicamente tres estrategias de implantación del sentido común en IA:

Elaborar un modelo teórico, de tipo general, de la realidad para que el sistema sea capaz de interactuar inteligentemente con el mundo exterior en toda clase de situaciones particulares. Los partidarios de esta alternativa se denominan “fundamentalistas”. Este modelo debe: a) razonar con conocimiento por defecto; b) razonar de forma genérica, es decir, que afecte a un amplio rango de dominios; c) tolerar incertidumbre en el conocimiento; d) tomar decisiones con conocimiento incompleto y revisar sus decisiones cuando se tenga mayor conocimiento o conocimiento completo; e) utilizar meta-conocimiento; f) detectar inconsistencias en el conocimiento (por ejemplo, que Newton no puede tener número de teléfono, o que una persona de 30 años no puede pesar 3 Kgr.).
Hacer un inventario, lo más exhaustivo posible, de conocimientos particulares de sentido común para utilizarlo con fines prácticos. Los partidarios de esta opción se denominan “Cyclistas”, por ser el sistema Cyc (que se describe más adelante) el paradigma de esta alternativa.
Olvidarse de lograr un conocimiento completo de sentido común, sea teórico o práctico, y centrarse exclusivamente en elaborar soluciones para cada sistema particular.

Entre estas alternativas, la mejor es la primera: un modelo de la realidad que pueda ser interiorizado por el sistema. Sin embargo, por no existir actualmente tal modelo, la opción más común ha sido la tercera: centrarse en resolver pequeños problemas, como el tema del mundo de los bloques y problemas particulares de dominios específicos. El resultado ha sido un gran número de modelos dispersos, desconectados entre sí.

El problema del lenguaje

Lo primero que se necesita para representar el conocimiento de sentido común, sea genérico o específico, es elegir un lenguaje de representación. El problema es que los lenguajes existentes no parecen los más adecuados para esta tarea. Normalmente se utiliza como base la lógica de predicados de primer orden, que se suele ampliar para intentar conseguir un lenguaje potente y expresivo. Las ampliaciones se realizan utilizando otras lógicas no-clásicas como: lógica por defecto (default logic), no-monótona, temporal, espacial, del conocimiento, de la creencia, de la obligación, de la intención, etc. También se utilizan los formalismos clásicos de representación del conocimiento: marcos, guiones, programación lógica, programación orientada a objetos, etc.

El problema es que, cuando se elige un determinado formalismo, nos estamos restringiendo a un solo paradigma. El paradigma elegido puede funcionar en ciertos dominios, pero ninguno es aplicable a todos. Lo que se suele hacer es usar diferentes lenguajes de representación para cada tipo de conocimiento de sentido común. Pero estos lenguajes no están conectados, son independientes. Estamos en la misma situación que con los paradigmas de programación.

Lo ideal es que hubiera un lenguaje unificado, con un paradigma universal, capaz de expresar todos los paradigmas particulares:

Basado en una serie de principios, capaz de expresar la lógica convencional y cualquier tipo de lógica no-clásica, y capaz de representar todo tipo de conocimiento, incluyendo el conocimiento de sentido común.
Suficientemente potente, general y expresivo.
Capaz de representar conocimiento específico y genérico.
Capaz de realizar inferencias automáticas de modo eficiente.
Capaz de representar conocimiento declarativo y operativo. El conocimiento declarativo tiene ventajas sobre el operativo: es modular (con módulos independientes entre sí), es más fácil de modificar, es más expresivo, compacto y comprensible.
Que permita expresar meta-conocimiento: la capacidad de razonar sobre los conocimientos de sentido común y que los gestione de forma eficiente.

Programas con sentido común, según McCarthy

John McCarthy [1958] −el acuñador del término “Inteligencia Artificial”− fue el primero en comprender la importancia del conocimiento de sentido común en IA. Para él, el razonamiento de sentido común es la clave de la IA:

Un programa tiene sentido común si es capaz de inferir automáticamente toda una clase de consecuencias inmediatas a partir de su conocimiento interno (su representación general o modelo del mundo) y de los inputs de cada situación del mundo externo.
Propuso un sistema de representación del conocimiento de sentido común basado en un lenguaje basado en la lógica de predicados.
También propuso un programa hipotético, el Advice Taker, un derivador automático de conclusiones o respuestas expresadas en ese lenguaje lógico y construido con el mismo lenguaje. Estas conclusiones podían ser sentencias declarativas o imperativas. Si la sentencia era imperativa, el programa ejecutaría la acción correspondiente.
Normalmente, una máquina es “instruida” sobre lo que tiene que hacer mediante una serie de sentencias imperativas. El objetivo es poder instruir a la máquina principalmente mediante sentencias declarativas, de la misma forma que los humanos.
El objetivo último debe ser conseguir programas que evolucionen aprendiendo de la experiencia, como hacen los humanos.

El proyecto Cyc

El intento más ambicioso de implementación del sentido común fue el sistema Cyc (abreviatura de “encyclopedia”), un proyecto liderado por Douglas Lenat [Lenat & Guha, 1990; Lenat, 1995]. Se trata de un proyecto de creación de una gran base de conocimientos orientados a facilitar el razonamiento humano de sentido común.

Lenat decía que le gustaría encontrar “las leyes de Maxwell el pensamiento”. Pero no creía en la existencia de unos primeros principios o primitivas semánticas en IA

El proyecto se inició en 1984, llegando a contemplar 100.000 conceptos y un millón de reglas o inferencias. Cyc se escribió en el lenguaje CycL, una versión ampliada de la lógica de predicados de primer orden, un lenguaje que contempla marcos, mecanismos de inferencia y mecanismos de restricciones para verificar la consistencia de los conocimientos.

Características:

La idea que subyace a Cyc es que el comportamiento inteligente de un sistema es imposible sin una gran cantidad de conocimientos de sentido común en su memoria. El lema era que “la inteligencia es 10 millones de reglas”.
Su objetivo no era el de generar inteligencia, sino el de construir una gran base de conocimientos para que los emplearan los futuros sistemas de IA y consiguieran inteligencia de sentido común.
Uno de los objetivos de Cyc era que el sistema, a partir de un cierto momento, fuera capaz de captar nueva información por sí mismo, leyendo libros y revistas.
Cyc utiliza un conjunto estructurado de conceptos. El concepto de más alto nivel es Thing (cosa). Cualquier cosa es una instancia (o caso particular) de Thing. Debajo de este nivel aparecen otros conceptos menos abstractos como: objeto individual, colección, sustancia, evento, proceso, agente, propiedades, etc.

Cyc, aunque ha sido útil en algunos casos particulares, no se ha encontrado ninguna forma genérica y efectiva de explotar todo su conocimiento acumulado. Actualmente el proyecto se considera fallido por tres razones:

Porque los conocimientos aislados a veces no son suficientes, necesitan un contexto.
Por el lenguaje (CycL), que es complejo, poco directo y no suficientemente genérico.
Porque CycL implementa muchos mecanismos inferenciales especializados (soporta unos 20 tipos de mecanismos de inferencia), pero sin una unidad subyacente, sin expresiones generales. Se ha abordado principalmente desde el punto de vista particular y superficial. Un sistema de conocimiento de sentido común debe basarse en conocimientos genéricos y no en multitud de conocimientos particulares. Hay que fundamentar todo en lo universal, en lo profundo, a partir de unos conceptos iniciales, primitivos o universales y de ahí ir derivando nuevos conceptos y las relaciones entre ellos. Lo específico debe ser siempre manifestación de lo genérico.

Durante un tiempo, el equipo Cyc necesitó definir categorías que parecían no tener fin. Pero en 1987, Cyc llegó a una fase que Lenat denominó “convergencia semántica”: los nuevos conceptos se podían definir a partir de los anteriores, pero no lo hicieron generalizando expresiones, sino simplemente copiando un conocimiento parecido y modificándolo ligeramente para conseguir el nuevo conocimiento.

Formalismos para Representación del Conocimiento de Sentido Común
Se han propuesto un gran número de modelos o formalismos para representar el conocimiento de sentido común para interactuar con el mundo real, un mundo esencialmente dinámico en el que se realizan acciones y se producen eventos que modifican el estado o situación del mundo a lo largo del tiempo. Estos modelos son de la denominada “física cualitativa”, que tratan de ontologías físicas o de sentido común a nivel físico: a nivel espacial, temporal y material. La física cualitativa solo considera propiedades esenciales, prescinde de las irrelevantes y permite inferir tendencias generales sin necesidad de realizar cálculos exactos. La formalización del sentido común de la física cualitativa debe distinguirse de los modelos matemáticos, precisos, cuantitativos, de la física tradicional o cuantitativa.

La formalización temporal se ha abordado principalmente mediante 3 enfoques: 1) mediante la referencia explícita a los puntos (momentos o instantes) de tiempo (representados como números reales) y sus relaciones; 2) mediante intervalos de tiempo y las relaciones entre ellos como p.e. A y B: A antes que B, A sigue a B, A y B comienzan a la vez, A y B terminan a la vez, A sucede durante B, A y B se solapan o A y B son iguales; 3) mediante eventos, que son hechos que ocurren en un cierto momento, sin referencia explícita al tiempo.
La formalización espacial se realiza de forma abstracta: mediante relaciones entre los objetos.
La formalización material se realiza mediante propiedades relevantes de tipo cualitativo.

Los formalismos más conocidos son los que se detallan a continuación.

Cálculo de situaciones (situation calculus)

McCarthy & Hayes [1969] presentaron el “cálculo de situaciones”, un intento de formalizar el razonamiento de sentido común en dominios dinámicos. Utilizaron para ello la lógica de predicados de primer orden. Se basa en dos conceptos:

Situación. Es una instantánea del mundo en un momento dado o instante t. Es equivalente a estado global o estado completo del mundo.
Acción. Es el medio que transforma una situación en otra. Las acciones establecen relaciones temporales entre estados.

Características:

Dada una cierta situación en un momento dado, si no hay ninguna acción, la situación no cambia. Es la denominada “ley de inercia del sentido común”.
Hay una situación inicial del mundo, S₀, y un conjunto Sit de situaciones posibles.
En cada situación hay que especificar todos los objetos que componen el mundo.
El tiempo es discreto, es decir, que los puntos temporales indican la sucesión de estados.
Causa y efecto son contiguos en el tiempo discreto. Los efectos de una acción se manifiestan en la situación siguiente.
Las acciones solo pueden actuar en ciertas situaciones.
No se permiten acciones simultáneas.
Se utilizan axiomas, que se expresan mediante funciones particulares o generales (parametrizables) del tipo f(a, s) = s', siendo a la acción que actúa en la situación s y que produce una nueva situación s'.
Mediante una secuencia de acciones se alcanza una situación final a partir de una situación inicial.

Un ejemplo, en el mundo de los bloques. Tenemos dos bloques, A y B, sobre una mesa, y un robot que puede coger o depositar un bloque cada vez.

Podemos representar las 5 situaciones posibles mediante predicados. El predicado libre(x) indica que sobre el bloque x no hay nada. El predicado sobre(x, y) indica que el bloque x está sobre el bloque y.

{libre(A), libre(B)} (los dos bloques están sobre la mesa)
{libre(A)} (el bloque A está solo sobre la mesa)
{libre(B)} (el bloque B está solo sobre la mesa)
{sobre(A, B)} (el bloque A está sobre B)
{sobre(B, A)} (el bloque B está sobre A)

Como siempre hay dos bloques, si un bloque no está en la mesa es porque lo tiene cogido el robot. Como el robot solo puede coger un bloque, la mesa nunca puede estar vacía.

Las acciones posibles las vamos a representar como: coger(x) indica coger el bloque x (puede estar sobre la mesa o sobre el otro bloque). Y poner(x, y) indica depositar el bloque x sobre y (puede ser la mesa o el otro bloque). Los axiomas que relacionan estas acciones con los estados son:

coger(A, {libre(A), libre(B)}) = {libre(B)})
coger(B, {libre(A), libre(B)}) = {libre(A)})
coger(A, {sobre(A, B)}) = {libre(B)}
coger(B, {sobre(B, A)}) = {libre(A)}
poner(B, A, {libre(A)}) = {sobre(B, A)}
poner(A, B, {libre(B)}) = {sobre(A, B)}
poner(A, mesa, {libre(B)}) = {libre(A), libre(B)}
poner(B, mesa, {libre(A)}) = {libre(A), libre(B)}

Obsérvese que no existe, por ejemplo, el axioma coger(A,{libre(B)} porque si sobre la mesa solo está el bloque B, el robot tiene cogido el A y no puede volver a cogerlo.

Podemos pasar, por ejemplo, de la situación {sobre(A, B)} a {sobre(B, A)} mediante una secuencia de cuatro acciones: coger(A), poner(A, mesa), coger(B) y poner(B, A).

El cálculo de eventos (event calculus)

Propuesto por Robert Kowalski y Marck Sergot [1986], es un formalismo lógico −utiliza la lógica de predicados de primer orden− para representar el conocimiento de sentido común. En vez de considerar situaciones o estados globales, considera eventos y fluentes. Un evento produce un efecto local en una parte del mundo de manera independiente y sin afectar a las otras partes del mundo. Un fluente es algo que varía con el tiempo (un objeto, una propiedad, etc.).

Un evento es como una acción que tiene efectos locales. Es por ello que más útil que el cálculo de situaciones puesto que solo requiere conocimiento local: los efectos de los eventos.
Se supone que los eventos actúan de forma instantánea.
Se supone también la ley de inercia del sentido común: si no se produce ningún evento, el mundo permanece inalterable.

El cálculo de eventos fue formalizado como un conjunto de cláusulas de Horn: una serie de condiciones (C₁ ... C_n) aumentadas con la posibilidad de la negación (condición contraria o no-condición) y una acción asociada A cuando se cumplen todas las condiciones. Este conjunto se podía ejecutar como un programa lógico en Prolog. En notación MENTAL:


(C1 → C2 →...→ Cn → A)

Kowalski contribuyó al desarrollo de la programación lógica, empezando por la interpretación procedural de las claúsulas de Horn [Kowalski, 1986].

El cálculo de eventos de Kowalski y Sergot es muy limitado. La generalización debería contemplar: eventos no determinísticos, concurrentes, de efectos retardados, de efectos graduales, no instantáneos (con duración) y eventos que se disparan automáticamente bajo ciertas condiciones. El cálculo de eventos fue ampliado por Rob Miller y Murray Shanahan [2002]. Otro formalismo fue propuesto por Erik Mueller [2009].

El cálculo de fluentes (fluent calculus)

El cálculo de fluentes [Thielscher, 1998] es un formalismo de de programación lógica e inspirada en la lógica ecuacional para razonamiento y planificación de acciones en dominios dinámicos. Hay 4 conceptos en el cálculo de fluentes:

Fluentes. Un fluente es un componente atómico de un estado del sistema y que varía con el tiempo. Se representan como términos lógicos, más que como predicados.
Estados. Un estado es una colección de fluentes. Es una instantánea de un mundo estable, es decir, que no está en transición. Un estado se obtiene concatenando fluentes con el operador diádico “o”, un operador tomado de la lógica ecuacional.
Acciones. Son los medios (causas) que hacen cambiar el estado del mundo.
Situaciones. Una situación es una secuencia de acciones.

Características:

Se supone que existe un estado inicial e₀.
La expresión Holds(f, e) indica que el fluente f está en el estado e.
Hay un conjunto de acciones posibles que actúan sobre estados y que producen nuevos estados. La notación Do(a, e) = e' indica el nuevo estado e' que se obtiene ejecutando la acción a en el estado e y que afecta a todos los fluentes de ese estado. Es un axioma de actualización de estado.
Hay una precondición asociada a cada par acción – estado.
Hay un estado vacío: ∅.
El operador “o” también permite concatenar estados para producir un nuevo estado.

Comparación con el cálculo de situaciones:

El cálculo de fluentes es una extensión del cálculo de situaciones. El cálculo de fluentes extiende el cálculo de situaciones con el concepto de estado y con el concepto de secuencia de acciones.
Ambos son teorías axiomáticas de las acciones para razonar y planificar acciones. El cálculo de situaciones usa axiomas de situación sucesora, y el cálculo de fluentes usa axiomas de actualización de estados.
Un estado en el cálculo de fluentes es equivalente a una situación en cálculo de situaciones.

MENTAL y la Representación del Conocimiento de Sentido Común
En primer lugar hay que decir que MENTAL es un lenguaje se sentido común porque es un conocimiento general sobre cómo está estructurado y cómo funciona el mundo. Es una especie de sexto sentido de tipo integrador que ve lo común o genérico en toda situación particular. Es decir, ve lo profundo en lo superficial, por lo que el sentido común está estrechamente relacionado con la conciencia.

La opinión general es que se necesitan múltiples métodos o técnicas de representación del conocimiento y múltiples formas de hacer inferencias, todas ellas basadas en la lógica formal. Pero esto no es cierto. Desde lo profundo hay unificación: solo es necesario un único lenguaje. Hasta ahora no había un lenguaje suficientemente genérico, potente, eficiente, y simple a la vez, que pudiera representar todo tipo de conocimiento, incluyendo el de sentido común. Este lenguaje es MENTAL, un lenguaje basado en arquetipos de la conciencia.

McCarthy intuyó que la clave de la IA residía en el conocimiento de sentido común. Pero realmente la clave de la IA reside en un nivel aún más profundo: en los arquetipos de la conciencia. La inteligencia es conectar lo superficial con lo profundo, lo general, y, en último término, con la conciencia, con lo universal. El límite reside en los arquetipos de la conciencia. La inteligencia, por lo tanto, no es diez millones de reglas, como afirma Lenat. La inteligencia es algo próximo a la conciencia: reside en la unión (vertical) de opuestos entre lo superficial y lo profundo, que permite relacionar los conocimientos superficiales (horizontales) a través de lo profundo.

Podemos distinguir tres niveles:

Los arquetipos de la conciencia.
Los conocimientos de sentido común, que se fundamentan en el nivel 1. Todos estos conocimientos están conectados a través de los arquetipos de la conciencia.
Las aplicaciones de IA, que se fundamentan totalmente en el nivel 1 y parcialmente en el nivel 2, pues las aplicaciones no necesitan todo el conocimiento del nivel 2, sino solo los conocimientos generales y los específicos del dominio. De todas formas, hay sistemas de IA que no necesitan sentido común. Son sistemas muy específicos, que se enfrentan a situaciones muy concretas, como los programas de jugar al ajedrez o los sistemas de diagnóstico médico. Pero, en general, todo sistema de IA afecta a diferentes aspectos del conocimiento de sentido común.

Antes de empezar a representar el conocimiento de sentido común o cualquier tipo de conocimiento, necesitamos un conocimiento más esencial: el conocimiento de la estructura arquetípica y profunda, la estructura de la realidad interna y externa. Y este conocimiento arquetípico es MENTAL.

Las características de MENTAL como lenguaje unificado para representación del conocimiento de sentido común son:

MENTAL es un lenguaje y un modelo de la realidad interna y externa que permite representar todo tipo de conocimientos, incluidos los de sentido común. MENTAL es la plataforma esencial de sentido común, la máxima aproximación posible a los conocimientos de sentido común. No puede haber conocimiento de sentido común sin algo que lo trascienda y fundamente, que son los arquetipos de la conciencia. Las primitivas corresponden a conceptos simples y comunes a estas dos realidades, donde se unifican ontología y epistemología. Son los conceptos esenciales de la realidad, los arquetipos primarios.
Desde el punto de vista de MENTAL, no hay diferencia esencial entre el conocimiento específico de un dominio y el conocimiento de sentido común, pues ambos se fundamentan en los arquetipos de la conciencia. Lo único es que el conocimiento de sentido común tiende a ser más genérico que el de los dominios particulares, pues el conocimiento de sentido común afecta a menudo a varios dominios.
MENTAL realiza inferencias automáticas especificando el conocimiento de sentido común mediante expresiones genéricas del tipo ⟨( condición → acción )⟩. También admite la condición completa (la que incluye la condición contraria).
MENTAL permite la representación de conocimiento declarativo y operativo.
En MENTAL no existe el tiempo físico, pues el tiempo cuantitativo, continuo y lineal pertenece al mundo físico. Tampoco existe el espacio físico tridimensional. En MENTAL espacio y tiempo están unidos, son abstractos y se manifiestan de manera secuencial o paralela. No obstante, puede considerarse un tiempo virtual, que genere eventos como expresiones del tipo “t = tiempo” de manera continua y lineal en el entorno.
Un evento tiene la forma

⟨( condición → acción )⟩

y donde “condición” y “acción” pueden ser cualquier expresión.
Un evento que produzca un efecto continuo entre dos instantes de tiempo (t1 y t2) se podría implementar mediante una expresión genérica de la forma

⟨( t>t1 → t<t2 → acción )⟩

siendo t1<t2.
Puede haber eventos ramificados. Un evento produce un efecto directo, pero este efecto puede generar otros eventos que producirían otros efectos indirectos.
En MENTAL, todas las expresiones son fluentes, es decir, que potencialmente pueden cambiar a lo largo del tiempo.
El mismo lenguaje, MENTAL, se utiliza para el conocimiento de sentido común (difuso, cualitativo) que para el conocimiento específico (científico, preciso, cuantitativo) de un dominio. Es la gran ventaja de disponer de un lenguaje universal.
Implica menos memoria. En primer lugar, porque el lenguaje es compacto. En segundo lugar porque todo conocimiento particular es fácilmente generalizable mediante expresiones genéricas.
Permite especificar meta-conocimiento. Por ejemplo, conocimiento sobre como gestionar o usar el conocimiento base, conocimientos generales de conocimientos generales, etc. Se expresan mediante expresiones genéricas de orden superior, como p.e. meta-reglas.
Con MENTAL todo se simplifica y unifica. No es necesario adherirse a un formalismo o paradigma particular, pues permite utilizar el más conveniente en cada caso. Y además se evitan las limitaciones asociadas a cada paradigma. MENTAL trasciende los formalismos concretos del conocimiento de sentido común. Aporta un paradigma unificador que permite implementar todo paradigma, incluidos los cálculos de situaciones, eventos y fluentes. Por ejemplo, los axiomas del cálculo de situaciones y de fluentes se especifican mediante expresiones genéricas.
Lenat encontró la “convergencia semántica” a posteriori, desde lo superficial, desde los casos particulares. Con MENTAL, la convergencia se establece a priori, desde lo profundo, desde los arquetipos primarios.
MENTAL permite interrelacionar todo tipo de conocimiento en una red de conocimientos entrelazados, compartidos, jerarquizados, etc. Ningún conocimiento queda aislado. Todo el esfuerzo hay que realizarlo utilizando el mismo lenguaje, construyendo expresiones genéricas que reflejen conocimiento general. Este es el camino.
Desde el punto de vista de MENTAL, el sentido común es un conjunto de restricciones de la libertad mental y de la imaginación. MENTAL va más allá del sentido común, pues es el lenguaje de los mundos posibles donde se trasciende el mundo físico y donde no impera necesariamente el sentido común. El sentido común es un tipo de conocimiento específico asociado al mundo físico. MENTAL es el fundamento del conocimiento de sentido común y del no-común. Este ultimo incluye el de la física cuántica y relativista.

Ejemplos prácticos

Todos los perros tienen cuatro patas.

⟨( {x/perro → x/(NumPatas/4) )⟩

o, con notación funcional:

⟨( {x/perro → (NumPatas(x) = 4) )⟩
“Hoy” es temporalmente mayor que “Ayer”:

( tiempo(hoy) > tiempo(ayer) )
Los padres son más viejos que los hijos.

⟨( (padre(x) = y) → (edad(x) > edad(y)) )⟩
El aserto “Juan pidió una paella al camarero” se puede expresar mediante atributos (que son relaciones binarias). Es una relación que podemos expresar como un cierto evento e con la siguiente estructura de atributos:
Y las siguientes inferencias:

Juan/humano (Juan es humano)
camarero/humano (el camarero es humano)
peticion/oral (la petición fue oral)
Juan/(edad ≥ (2*años)) la edad de Juan es al menos de 2 años)
camarero/adulto (el camarero es un adulto)
lugar/Restaurante (el encuentro tuvo lugar en un restaurante)
Juan/(cliente(Restaurante)) (Juan es cliente del restaurante)
{Juan Camarero}/Próximos (Juan y el camarero estaban espacialmente próximos)
(idioma(Juan) = idioma(camarero)) (Juan y el camarero hablaban el mismo idioma)

Se puede expresar también la probabilidad o grado de certeza de que el restaurante estuviera en España, aplicando un factor (por ejemplo, 0.9) a la expresión correspondiente:

Restaurante/(0.9*(lugar/España))

Adenda
Open Mind Common Sense Project

Es un proyecto del Media Lab del MIT [Singh et al, 2002]. Es parecido a Cyc, pero tiene la particularidad de que es abierto. Cualquier persona puede registrarse en la Web y añadir conocimientos o valorar los ya existentes. Todo el conocimiento adquirido se integra en Concept.Net, una red semántica de conocimientos de sentido común que permite realizar inferencias. Es la mayor fuente de recursos mecanizados de conocimientos de sentido común y está disponible libremente (www.conceptnet.org). Los nodos representan conceptos en forma de fragmentos (palabras o frases cortas) del lenguaje natural. Las flechas entre nodos son las relaciones entre los conceptos. Está disponible una API pública para que las aplicaciones de los usuarios puedan acceder a su contenido. Consta de más de 700.000 elementos de conocimiento de sentido común, resultado de las contribuciones de más de 14.000 personas de todo el mundo.

Cyc Foundation

La Cyc Foundation (www.cycfoundation.org) es una organización sin ánimo de lucro que mantiene la ontología OpenCyc, una base de conocimientos derivada de la base de conocimientos de Cyc, para la Web Semántica.

Bibliografía

Barwise, Jon; Perry, John. Situations and Attitudes. MIT-Bradford, 1983.
Commonsense Reasoning Organization. http://commonsensereasoning.org/
Commonsense Computing Initiative. http://csc.media.mit.edu/
Davis, Ernest; Morgenstern, Leora. Introduction: Progress in formal commomsense reasoning. Artificial Intelligence 153, pp. 1-12, 2004.
Elio, Renee (ed.). Common Sense, Reasoning, and Rationality. Oxford University Press, 2002.
Kowalski, Robert; Sergot, Marck. A logic-based calculus of events. New Generation Computing 4 (1), pp. 67–95, 1986. Disponible en Internet.
Kowalski, Robert. Predicate Logic as Programming Language. Computers for Artificial Intelligence Applications, (eds. Wah, B. and Li, G.-J.), IEEE Computer Society Press, Los Angeles, pp. 68–73, 1986. Disponible en Internet.
Lenat, Douglas B. Computers Versus Common Sense. Video, 30 Mayo 2006.
Lenat, Douglas B. Cyc. A large-scale investment in knowledge infrastructure. Comms. ACM 38 (11) pp. 32–38, 1995.
Lenat, D.B; Guha, R.V. Building Large Knowledge Based Systems. Addison Wesley, 1990.
Lifschitz, Vladimir. Formalizing Common Sense. Papers by John McCarthy. Ablex Pub., 1990.
Lifschitz, Vladimir. The Logic of Common Sense. Is the theory of commonsense reasoning a branch of logic or does it belong to artificial intelligence? ACM Computing Surveys. 27(3): 343-345, 1995.
McCarthy, John. Programs with Common Sense. Symposium on Mechanization of Thought Processes. National Physical Laboratory, Teddington, England, 1958. Disponible en Internet.
McCarthy, John; Hayes, Patrick J. Some philosophical problems from the standpoint of artificial intelligence. In Meltzer, B. and Michie, D. (editors), Machine Intelligence 4, pp. 463–502. Edinburgh University Press, 1969. Disponible en Internet.
Miller, Rob; Shanahan, Murray. Some Alternative Formulations of the Event Calculus. Lecture Notes in Artificial Intelligence, vol. 2408, 2002. Disponible en Internet.
Minsky, Marvin. Commonsense-Based Interfaces. Communications of the ACM, 43 (8), August 2000. Disponible en Internet.
Morado, Raymundo. La formalización del sentido común. En María José Frápolli Sanz (coord.) Filosofía de la Lógica, Tecnos, pp. 233-253, 2007.
Mueller, Erik T. Automating Commonsense Reasoning Using the Event Calculus. Communications of the ACM, 2009.
Mueller, Erik T. Commonsense Reasoning. Morgan Kaufmann, 2006.
Open Mind Common Sense. http://commons.media.mit.edu.
Open Mind Initiative. http://openmind.org/
Palau, Gladys Dora. Lógicas condicionales y razonamiento del sentido común. Gedisa, 2005.
Reiter, Ray. Knowledge in Action. Logical Foundations for Specifying and Implementing Dynamical Systems. MIT Press, 2001.
Sarbo, Janos J. On the Logic Underlying Common Sense. Internet.
Singh, P. et al. Open Mind Common Sense. Knowledge acquisition from the general public. In Proceedings of ODBASE’02. LNCS. Heidelberg: Springer-Verlag, 2002.
The Common Sense Problem Page. http://www-formal.stanford.edu/
leora/commonsense/. Web orientada a investigadores interesados en formalizaciones del razonamiento de sentido común.
Thielscher, Michael. Ramification and causality. Artificial Intelligence 89, pp. 317–364, 1997.
Thielscher, Michael. Introduction to the Fluent Calculus. Electronic Transactions on Artificial Intelligence, 2(3-4): 179–192, 1998. Disponible en Internet.
Schiffel, Stephan; Thielscher, Michael. Reconciling Situation Calculus and Fluent Calculus. Internet.
van Breemen, A.; Sarbo, J.; van der Weide, T.P. Toward a theory of natural conceptualization. Technical Report R07002, University of Nijmegen, 2007. Disponible en Internet.